aprendizagem por reforço
Posts
- A Disney Research projetou o Olaf como um robô físico que anda, com pernas assimétricas, políticas de reinforcement learning sensíveis à temperatura e recompensas de redução de impacto. Eis por que essas técnicas importam além do entretenimento.